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摘要 随 着 电子 商务 的 快速 发 展 ， 互 联网 上 出 现 大 量 商品 评论 信息 ， 商 品评 论文 本 的 情感 分 析 与 挖 据 对 
于 研究 商品 口碑 、 进 行商 品 推荐 都 具有 重要 的 价值 。 文中 设计 商品 属性 提取 与 过 滤 算 法 、 情 感 词 判别 算法 ， 
分 析 商品 的 评论 信息 并 自动 抽取 用 户 关 注 的 商品 属性 和 用 户 对 相应 属性 的 评价 观点 ， 进 一 步 将 其 应 用 于 商 
品评 价 文 本 的 情感 倾向 性 分 析 。 在 真实 数据 集 上 进行 测试 取得 了 准确 率 81.08%， 召 回 率 88. 23%。 
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Sentiment Analysis and Mining of Product Reviews 
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(Wational Science Library, Chinese Academy of Sciences , /nformation System Division ,Beiyinge 100190 ) 
Abstract With the rapid development of e-commerce, a large number of product reviews arise on the Internet, 
and the sentiment orientation analysis and mining of product reviews become important for the study of the 
product reputation and recommending. In this paper, we design the algorithm of product attribute extraction and 
the word sentiment recognition. It will extract the product reviews and the corresponding evaluation point 
according to the analysis of the product reviews. Finally ,the sentiment orientation analysis of the product reviews 
is finished by the use of the above result. The System achieves the accuracy of 81.08% and the recall of 88.23% on 
the real data set and we give the result analysis. 
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司 误 包括“ 入“ 清晰、 只 第“ 汪 级 等。 | 。 对 于 每 个 评价 短语 ， 抽 取出 名 词 短 语 ， 放 入 属 

通过 抽取 到 得 这 些 商品 属性 以 及 对 应 情感 词 。 | 性 集合 

可 以 为 商品 建立 一 个 情感 分 析 的 知识 库 ， 这 个 知识 | 3， 对 于 每 个 评价 短语 ， 抽 取出 形容 词 短语 ， 放 入 


情感 词 集合 
库 可 以 用 来 进行 新 的 商品 评论 情感 倾向 性 分 析 , 建 | 全 政信 

立 评价 时 成河 、 4. F 中 fi 元 素 ， 若 fi; 在 评价 数据 中 出 现 频率 低 于 
立 评价 属性 与 情感 词 的 对 应 关系 可 以 解决 情感 词 i 

修饰 不 同属 性 情感 倾向 不 同 的 问题 。 同 时 ， 在 此 基 。 | 5，s 中 sj 元 素 ， 若 sj 在 评价 数据 中 出 现 频率 低 了 
础 上 进行 深层 挖掘 ， 例 如 找 出 用 户 比较 关注 的 商品 ”| % ， 则 从 集合 中 删除 。 

属性 、 找 到 用 户 最 不 满意 的 商品 属性 、 找 到 用 户 差 ”| 4 丛 F 和 S 中 任意 取 一 对 元 素 <f, si>， 如 果 这 两 
评 最 个 元 素 同时 出 现在 某 评 价 短语 中 ， 那 么 这 两 个 元 素 
Bi 组 成 一 个 评价 对 ， 所 有 评价 对 组 合 组 成 评价 对 集合 


属性 情感 词 PairSet。 


nm 


性 等 [15]。 


re 
由 


(a 5， 对 于 F 中 所 有 元 素 ， 如 果 没有 出 现在 PairSet 
< 中 ， 从 下 中 除去 该 元 素 。 
Se 属性 6， 对 于 S 中 所 有 元 素 ， 如 果 没 有 出 现在 PairSet 
ge 中 ， 从 S 中 除去 该 元 素 。 


7.， 经 过 如 上 过 滤 后 , 得 到 商品 属性 
图 2 商品 属性 与 情感 词 抽取 结果 示例 集合 S。 


el 
全 
hn 


合 F, 情感 词 


| 
| 
7 
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出 来 作为 基准 情感 词 使 用 。 由 于 抽取 到 的 商品 评价 
数据 的 情感 倾向 可 以 根据 评价 的 星 级 确定 ， 我 们 利 
己 有 评价 数据 的 情感 倾向 来 确定 情感 词 的 情感 
倾向 。 使 用 开 方 检验 〈CHI) 方法 计算 情感 词 和 正 
负面 类 别 的 关联 程度 ， 开 方 估计 值 越 大 表示 情感 词 
的 情感 倾向 越 可 靠 。 每 一 个 商品 属性 的 每 一 个 情感 
词 分 别 计算 CHI 值 ， 在 类 别 中 情感 词 的 CHI 值 如 公 
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其 中 ，N 为 训练 语 料 中 的 文档 总 数 ，c 为 某 一 
类 别 ，t 为 某 情 感 词 ，A 为 属于 类 别 c 且 包 含情 感 
词 的 文档 个 数 ，B 为 不 属于 类 别 但 包含 情感 词 
t 的 文档 个 数 ，C 为 属于 类 别 e 但 不 包含 情感 词 t 
的 文档 个 数 ，D 为 不 属于 类 别 c 且 包 含情 感 词 t 的 
文档 个 数 。 分 别 计算 情感 词 + 和 正 负 两 个 类 别 的 关 
联 度 ， 关 联 度 较 大 的 类 别 作为 该 情感 词 t 的 情感 倾 
向 。 


对 于 每 个 商品 属性 抽取 出 对 应 的 情感 词 , 并 对 
情感 词 按照 出 现 频率 进行 排序 ， 将 出 现 频率 与 CHI 
值 大 于 阔 值 的 情感 词 抽取 出 来 作为 基准 情感 词 ， 这 
里 使 用 的 频率 阔 值 为 0. 1，CHI 阔 值 为 0.9， 基 准 情 
取 更 加 注重 准确 率 利用 抽取 到 的 基准 情 
感 词 集 进一步 扩展 将 提高 召回 率 。 


4. 2 评价 短语 的 情感 倾向 判断 

利用 抽取 到 的 基准 情感 词 集 进一步 扩展 情感 
词 集合 规模 ,计算 情感 词 和 基准 情感 词 的 距离 主要 
使 用 PMI-IR 算法 等 1。PMI-IR 算法 计算 公式 如 公 
式 2 所 示 。 


P(word & word,) 


PMI(wordi, word,)= ]og( 一 一 一 一 一 一 一 
+ P(word )P(word,) 


) (公式 2) 


其 中 P (wordi&words) 表示 word 和 word: 同 时 出 
现 的 概率 ，P(word) 表示 word 出 现 的 概率 。 

当 计算 一 个 情感 词 的 情感 倾向 时 可 以 计算 该 
词 和 基准 情感 词 表 中 正 负面 情感 词 表 中 所 有 词 的 


距离 U1， 如 公式 (3) 所 示 。 


SO— PMI(word)= > PMI (word, pword ) — 


pwordePset 


> PMI (word,nword XK 公式 3) 


nwordeNset 


其 中 word 为 待 计算 情感 倾向 的 新 词 ，Pset 为 
基准 情感 词 的 讲义 情感 词 集合 , Nset 为 基准 情感 词 
的 贬义 情感 词 集 。 
使 用 这 种 方法 可 以 计算 特定 领域 中 一 些 情感 
倾向 很 明确 的 情感 词 的 情感 倾向 ， 然 而 同一 个 情 
感 词 修饰 不 同 商品 属性 可 能 会 出 现 情感 倾向 相反 
的 情况 ， 例 如 : 
“手机 屏幕 很 大 ” “手机 噪音 很 大 ” 
这 里 “大 ”同时 作为 “屏幕 ”和 “噪音 ”两 个 
属性 的 情感 词 。 当 作为 修饰 “屏幕 ”的 情感 词 时 为 
正面 情感 词 ， 当 作为 修饰 “噪音 ”的 情感 词 时 为 负 
上 情感 词 。 如 果 将 “大 ”作为 一 个 情感 词 计算 与 基 
准 词 的 距离 ， 无 论 计算 结果 如 何 都 不 准确 。 这 里 对 
PMI 方法 进行 改进 , 不 再 仅 计算 情感 词 之 间 的 距离 ， 
而 是 计算 《< 属性、 情感 词 >Pair 与 基准 情感 词 之 间 的 
距离 来 得 到 《< 属 性、 情感 词 >Pair 内 情感 词 的 情感 倾 
名 ， 上 例 中 不 再 计算 “大 ”与 基准 情感 词 的 PMI 值 
而 是 计算 出 现 < 屏 幕 ， 大 > 这 个 评价 短语 与 基准 情感 


词 集 的 PMI 值 ， 改 进 的 方法 如 公式 (4)。 
SO — PMI( feature, word) = 


H 


7 


> PMI(< feature, word >, pword) 一 


pwordePset 


> PMI(< feature, word >, nword) 


nwordeNset 


计算 word 作为 情感 词 修饰 feature 属性 时 , word 
的 情感 倾向 ， Pset、Nset 含义 同 公式 (3)。 


(公式 4) 


4. 3 商品 评论 情感 倾向 性 分 析 


由 取 到 的 商品 属性 和 每 个 属性 对 应 的 情感 词 
可 以 作为 进行 情感 倾向 性 分 析 的 知识 库 进 行商 品 
评论 的 情感 倾向 性 分 析 081。 例 如 通过 对 手机 评论 信 
息 进行 抽取 可 以 得 到 手机 的 商品 属性 、 每 条 忆 

应 的 评价 情感 词语 和 使 用 这 些 情感 词 评价 属性 时 
的 情感 倾向 性 。: 上 1 相同 领域 的 一 条 评论 文本 时 
处 理 方法 如 


El 


el 


性 对 


Ws 
滞 
M2 


er 
人 属性、 情感 | | 
| | 词 修饰 关系 | | 

\ 


、, 商 品评 论 情感 倾 


wd 信 从 抽取 一 > 这 人 帮 机 一 二 
we 


图 3 丙 


评论 情感 倾向 性 分 析 


了 如 


对 于 每 条 评价 短语 , 基于 知识 库 抽 取出 评价 属 

性 。 例 如 知识 库 中 己 经 有 抽取 到 的 “屏幕 “电池”、 
“系统 ”等 属性 ， 而 评价 短语 中 出 现 了 “屏幕 ”这 
个 属性 词 ， 则 将 “屏幕 ”作为 抽取 到 的 属性 词 。 

对 于 每 条 评价 短语 , 基于 知识 库 抽 取出 评价 情 
感 词 。 根据 知识 库 中 商品 属性 和 评价 情感 词组 合 的 
情感 倾向 得 出 评价 短语 的 情感 倾向 。 将 每 条 评价 短 
语 的 情感 倾向 汇总 得 出 整体 评价 倾向 。 

商品 属性 评论 观点 汇总 , 由 提取 到 的 商品 属性 
评价 情感 词 可 以 汇总 得 到 用 户 对 于 
某 一 个 商品 的 评价 ， 如 价格 对 应 的 评价 有 “实惠 ”、 
“便宜 入 “贵人 “合适 和 “合理 和 “不 错 ” 等 ， 通 
过 发 现 的 商品 属性 和 对 应 的 情感 词 可 以 得 到 每 个 
属性 对 应 的 评价 观点 ,分 析 各 种 评价 观点 的 出 现 频 
率 可 以 发 现 用 户 对 于 属性 的 评价 热点 。 


站 
全 
eal 
全 
上 
这 
下 
Pa 


5 实验 与 分 析 


5. 1 实验 数据 


本 文 实验 数据 通过 抓 取 电 商 网 站 京东 商城 
(www. jd. com) 一 些 比较 热门 的 关于 手机 商品 评论 
数据 。 网 站 上 的 用 户 评论 数据 包含 对 商品 的 评论 文 
本 信息 和 用 户 对 商品 评价 的 星 级 ， 用 户 对 商品 评价 


越 高 则 给 出 的 星 级 越 高 ， 反 之 , 星 级 越 低 , 星 级 从 1 
( 低 ) 到 5《〈 高 ) 分 布 如 表 2 所 示 。 


表 2 实验 数据 评论 星 级 分 布 


商品 一 星 二 星 三 星 四 星 五 星 
商品 1 2 2 6 25 65 
商品 2 3 1 8 31 57 
商品 3 ll 0 3 23 73 
5. 2 评价 指标 

本 文采 用 准确 率 、 召 回 率 及 F 值 作为 评价 指 
标 。 

准确 率 : 

P= 双 (公式 5) 
p+fp 

其 中 tp 为 分 析 结 果 中 正确 的 数目 , fp 为 分 析 

结果 中 错误 的 数目 。 例 如 评价 商品 属性 抽取 的 准确 


率 时 ,tp 表示 抽 ] 


取 到 的 商品 属性 中 正确 的 数目 , fp 


为 系统 抽取 结果 认为 是 商品 属性 但 实际 上 不 是 商 


品 属性 的 数目 。 


品 属性 数目 。 


人 
tp+fn 


其 中 tp 为 分 届 
的 但 没有 被 识别 出 上 
可 率 时 , tp 表示 


〈 公 式 6) 


结果 中 正确 的 数目 ,fn 为 正确 
的 数目 。 例 如 评价 商品 属 1 


后 抽取 


召 由 取 到 的 商品 属性 中 确实 为 商品 
属性 的 数目 , fn 为 在 评论 中 出 现 但 没有 抽取 到 的 商 


调和 平均 值 : 

F = < = 2 (公式 7) 
1 1 P+R 
一 十 一 
P R 


5. 3 商品 属性 与 评价 短语 抽取 结果 分 析 


实验 数据 中 发 现 用 户 关注 属性 主要 集中 在 “ 质 


2 好 革 2”  66 
~ 


里 、 上 并 和 斋 


外 池 和 “价格 ”等 方面 。 实 验 抽取 


到 的 部 分 商品 属 | 


H 


生 和 记 


EF 价 短语 如 表 3 所 示 。 


表 3 抽取 属性 与 评价 短语 示例 值 为 3 时 取得 较 好 结果 。 通 过 观察 可 以 发 现 召 回 率 


属性 正面 评价 短语 负面 评价 短语 比较 厨 ，| 大 为 某 些 很 多 评论 中 出 现 了 相同 的 属性 局 
屏幕 屏 莫大、 屏幕 清晰 、 屏 幕 。 屏幕 小 、 屏幕 暗 、 屏 幕 息 ， 虽 然 在 某 些 评论 中 的 属性 没有 抽取 出 来 ， 但 是 
全 用 个 作客 生 人 人 在 其 他 评论 中 抽取 出 来 之 后 可 以 相互 弥补 ， 所 以 整 
敏 … 、 a a 
一 一 体 召回 率 较 高 。 准 确 率 比 召 回 率 要 低 一 些 ， 通 过 进 
质量 质量 很 好 、 质 量 放心 、 质 ” 质量 太 差 、 质 量 不 好 
i 法 还 > i 六 提高 准 产 s。 
二 人 让 步 改进 算法 还 可 以 进一步 提高 准确 率 
电池 电池 耐用 、 电 池 够 用 、 电 ”电池 发 热 、 电 池 不 好 、 5.4 商品 评论 倾向 性 分 析 
池 给 力 、 电 池 不 错 … ”电池 不 行 、 电 池 很 差 、 a 
抽取 到 商品 属性 和 每 个 属性 对 应 的 情感 词 以 
电池 不 经 用 … 
后 就 可 以 使 用 抽取 到 的 信息 进行 情感 倾向 性 分 析 ， 
耸 硼 价格 便宜 、 价 格 实惠 、 价 ”价格 贵 、 价 格 偏 高 … 
格 划算 、 价 格 公道 … 对 于 每 条 评论 数据 分 析 的 结果 为 : 这 条 评论 信息 评 
Ey 系统 好 系统 老 、 系 统 慢 … 价 的 商品 属性 以 及 对 该 属性 的 情感 倾向 是 正面 还 
三 件 商 品 , 每 件 商品 100 条 商品 评价 数据 , 抽 是 负面 。 这 里 使 用 1700 篇 商品 评论 数据 抽取 商品 
取 商 品 属性 经 过 人 工 评价 ， 使 用 表 〈1) 算法 中 不 属性 、 情 感 词 、 确 定 情感 词 修饰 商品 属性 时 的 情感 


同 的 a 阔 值 采用 召回 率 、 准 确 率 、 调 和 平均 值 表 倾向 ， 然 后 使 用 这 个 知识 库 进 行情 感 倾向 性 分 析 ， 
示 实 验 结果 ， 得 出 结果 如 图 4 所 示 。 三 件 商品 ， 每 对 三 种 商品 的 评论 数据 进行 实验 ， 每 个 商品 有 100 
牛 商品 100 条 商品 评价 数据 ， 抽 取 评 价 短语 经 过 人 条 评论 进行 情感 倾向 性 分 析 ， 人 工 对 分 析 结果 进行 
工 评价 ， 使 用 表 (1) 算法 中 不 同 的 a 浆 值 采用 召 评价 结果 如 表 4 所 列 。 


可 率 、 准 确 率 、 调 和 平均 值 表示 实验 结果 ， 得 出 结 表 4 商品 评论 情感 倾向 性 分 析 结 果 表 
果 如 图 5 所 示 。 商品 名 召回 率 准确 率 入 
手机 商品 1 85. 18% 79. 31% 82 14% 
100% Oo 
90% 人 手机 商品 2 85. 71% 80. 00% 32 76% 
| 80% 一 一 召回 宇 站 口 og y 50% 
Si 手机 商品 3 88. 23% 81. 08% 84. 50% 
60% 一 w= 一 F 值 
El 全 3 4 世 
a 羡 什 从 实验 结果 可 以 看 到 , 不 同 商品 的 倾向 性 分 析 
结果 ， F 均 Es 80%b 上 下。 明 使 这 中 方法 进行 
4 商品 属性 抽取 结果 评价 天 未 值 均 在 80% 以 表明 使 用 这 种 方法 进行 
前 品 评论 的 情感 倾向 性 分 析 切 实 可 行 。 进 行情 感 倾 
| i 句 性 分 析 之 后 ， 对 不 同 的 评价 观点 按照 各 个 商品 属 
洋 es 六 
i 一 一 五 加 六 性 进行 分 析 ， 如 图 6、 图 7、 图 8 所 示 。 
70% 
60% = 
: 侍 - 训 瑟 14 
a 图 信 . 1 1 三 邮 一 
由 1 二 三 一 此 一 二 
里 81 全 夺 主 1 负面 
图 5 商品 评价 短语 抽取 结果 评价 六 和 [过 委 一 大 | 站 上 和 
三 硅 三 = 正面 
2 二 主 -一 皇 - 一 三 | 由 
从 图 4、 图 5 中 可 以 看 出 当 阔 值 a 较 小 时 ， 0 二 和 
0 l . . | 吾 是 化 条 到 及 
较 多 元 余数 据 存在 准确 率 较 低 ， 召 回 率 较 高 ， 当 立 评价 局 性 
值 a 较 大 时 ， 能 见 余 数据 减少 ， 但 是 一 些 正确 的 
结果 也 被 过 滤 掉 ， 召 回 率 较 低 ， 准 确 率 较 高 ， 在 阐 有 6 手机 商品 1 评价 情感 倾向 性 分 析 结 果 


16 
147 Wl 
1 = 
:EE 
3 和 三 三 注 负 
| 国 二 宏 二 到 二 汪 S 
* 4 三 委 和 皇 生 = 王 
,上 + 三 ee === 
) 二 宇 等 等 于 
价格 ”电池 三 懈 区 内 
评价 属性 
图 7 手机 商品 2 评价 情感 倾向 性 分 析 结果 
40 
35 十 一 
30 
25 1 负面 
0 三 三 - 
§ | 大 = 下 
站 三 
二 -一 怖 Wl 
屏幕 运行 速度 电池 声音 
评价 属性 


手机 商品 3 评价 情感 倾向 性 分 析 结 果 


| 
co 
| 


手机 1 为 一 款 诺基亚 传统 功能 手机 , 从 上 面 可 
以 看 出 用 户 的 评价 热点 反应 出 了 该 商品 的 特点 : 手 
机 质量 很 好 ， 价 格 便宜 ， 电 池 够 用 ， 屏 幕 较 小 、 功 
能 较 少 、 系 统 较 旧 。 用 户 对 质量 、 价 格 非常 满意 ， 
对 电池 比较 满意 ， 对 屏幕 、 功 能 、 系 统 不 太 满 意 。 
手机 2 为 一 款 入 门 智能 机 ， 从 分 析 结 果 可 以 看 出 用 
户 对 价格 和 功能 很 满意 ， 对 质量 和 屏幕 基本 满意 ， 
对 电池 和 内 存 不 满意 ， 这 样 的 分 析 结 果 基 本 反映 了 
该 手机 的 特点 。 手 机 3 为 一 款 大 屏 智 能 机 ， 从 分 析 
结果 可 以 看 出 用 户 反 映 最 多 的 是 屏幕 很 好 、 运 行 速 
度 很 满意 ， 用 户 对 这 两 个 方面 的 反馈 最 多 ， 同 时 用 
指出 电池 和 手机 声音 不 好 。 分 析 结 果 较 好 地 反映 
了 各 款 手 机 的 相对 特点 ， 对 用 户 、 商 家 、 生 产 厂 家 
有 很 好 的 参考 价值 。 


6 结论 
本 文 实现 了 自动 化 的 商品 属性 和 评价 情感 词 


抽取 ， 实 现 了 商品 评论 的 情感 倾向 性 分 析 ， 性 能 达 


到 80% 以 上 ， 实 验 结 果 表 明 该 方法 取得 较 高 准确 率 
和 召回 率 ， 然 而 有 些 方面 还 需要 进一步 完善 改进 ， 
某 些 评价 属性 和 评价 观点 是 类 似 的 需要 进一步 聚 
类 ， 例 如 “价格 合适 ”与 “价格 合理 ”应 该 归并 为 
一 条 。 通 过 本 文 工 作 完成 了 对 商品 评论 中 关于 商品 
性 的 评论 挖掘 ， 抽 取出 了 评论 的 属性 并 判断 了 评 
论 的 正 负面 ， 后 续 工 作 可 以 根据 情感 倾向 性 分 析 结 
果 向 用 户 推荐 优质 商品 等 应 用 。 
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